智能论文笔记

音频数据增强是培训深度神经网络以解决音频分类任务的关键步骤。在本文中，我们在Matlab中引入了一个新型音频数据增强库的录音机。我们为RAW音频数据提供了15种不同的增强算法，8用于频谱图。我们有效地实施了几种增强技术，其有用性在文献中被广泛证明。据我们所知，这是最大的Matlab音频数据增强图书馆可自由使用。我们验证了我们在ESC-50数据集上评估它们的算法的效率。可以在https://github.com/lorisnanni/audiogmenter下载工具箱及其文档。

translated by 谷歌翻译

Deep Reinforcement Learning is emerging as a promising approach for the continuous control task of robotic arm movement. However, the challenges of learning robust and versatile control capabilities are still far from being resolved for real-world applications, mainly because of two common issues of this learning paradigm: the exploration strategy and the slow learning speed, sometimes known as "the curse of dimensionality". This work aims at exploring and assessing the advantages of the application of Quantum Computing to one of the state-of-art Reinforcement Learning techniques for continuous control - namely Soft Actor-Critic. Specifically, the performance of a Variational Quantum Soft Actor-Critic on the movement of a virtual robotic arm has been investigated by means of digital simulations of quantum circuits. A quantum advantage over the classical algorithm has been found in terms of a significant decrease in the amount of required parameters for satisfactory model training, paving the way for further promising developments.

translated by 谷歌翻译

DropKey

Bonan Li , Yinhan Hu , Xuecheng Nie , Congying Han , Xiangjian Jiang , Tiande Guo , Luoqi Liu

分类：计算机视觉

2022-08-04

在本文中，我们专注于分析和改进视觉变压器自我发项层的辍学技术，这很重要，同时令人惊讶地被先前的作品忽略了。特别是，我们对三个核心问题进行研究：首先，自我发挥层的下降是什么？不同于文献中的注意力重量不同，我们建议在注意矩阵计算之前向前移动辍学操作，并将钥匙设置为辍学单元，从而产生一种新颖的辍学效果。从理论上讲，我们验证了该方案是否有助于保持注意力重量的正则化和概率特征，从而减轻了过度拟合问题的特定模式，并增强了模型以捕获重要信息；第二，如何在连续层中安排下降比？与利用所有层的恒定下降比相反，我们提出了新的减少时间表，该计划逐渐降低了沿自我注意力层的堆叠比率。我们通过实验验证提出的时间表可以避免在低水平特征中过度贴合，并且在高级语义中缺失，从而提高了模型训练的稳健性和稳定性；第三，是否需要执行结构化辍学操作为CNN？我们尝试基于补丁的辍学操作区块，发现CNN的这种有用的技巧对于VIT并不是必需的。考虑到以上三个问题的探索，我们提出了一种新颖的Dropkey方法，该方法将密钥视为下降单元和利用下降比的减少时间表，以一般方式改善VIT。全面的实验证明了Dropkey对各种VIT体系结构的有效性，\ Emph {e.g。} T2T和Volo以及各种视觉任务，\ Emph {e.g。}，图像分类，对象检测，人类对象相互作用和人体形状检测和人体形状恢复。代码将在接受后发布。

translated by 谷歌翻译

我们提出了一种小型任务，可以衡量人们如何基于观察单个（实验1）或几个（实验2）对象对之间的因果相互作用来概括物体的因果动力。我们提出了一种计算建模框架，可以在我们的任务环境中综合人类的泛化模式，并阐明人们如何有效地浏览可能的因果函数和类别的组成空间。我们的建模框架结合了使用代理和收件人对象的特征和关系的因果函数发生器，以及贝叶斯非参数推断过程，以控制基于相似性的概念。我们的模型具有自然的“资源合理的”变体，可以在描述参与者时优于一个天真的贝叶斯账户，特别是在我们的行为实验中再现透明阶效应和因果不对称。我们认为，该建模框架为真实世界因果概念提供了计算上的合理机制。

translated by 谷歌翻译